查看原文
其他

NBT:未培养病毒基因组的最少信息标准(MIUViG)

宏基因组 宏基因组 2022-05-08

未培养病毒基因组的最少信息标准

Minimum Information about an Uncultivated Virus Genome (MIUViG)

原文链接:https://www.nature.com/articles/nbt.4306

Nature Biotechnology [IF = 31.864]

DOI: https://doi.org/10.1038/nbt.4306

第一作者:Simon Roux1

通讯作者:Simon Roux1(sroux@lbl.gov)  和 Emiley A Eloe-Fadrosh1(eaeloefadrosh@lbl.gov)

所有作者:

主要单位:

1 美国 加利福尼亚州 胡桃溪市 能源部联合基因组研究所 US Department of Energy Joint Genome Institute, Walnut Creek, California, USA

Resource:2018-12-17

写在前面

扩增子的最小信息标准发表在2011年的NBT上(NBT:扩增子及其他测序的最小信息标准和测序规范(MIMARKS)),在最小信息标准发表后的2012年,扩增子测序逐渐开始蔓延,2015-2016年火热,在最近两年才慢慢平稳。时隔7年的2018年,同样在NBT上发表了病毒测序的最小信息标准。病毒研究确实是一个新领域,并且能看到这两年逐渐升温,新型冠状病毒的出现可能会加速病毒领域的研究,这将进一步加速病毒测序技术方法和生物信息学分析的成熟,相信大爆发时间不会太晚,也许在本年末,还是明年?反正是发展迅速并且很有前途的方向。我们是否也要当弄潮儿呢?

摘要

我们提出了关于任何序列标准的最小信息的扩展,用于报告基于非培养病毒基因组的序列。关于未培养病毒基因组(Minimum Information about any (x) Sequence,MIUViG)标准的最少信息是在基因组标准联盟框架内制定的,包括病毒起源、基因组质量、基因组注释、分类信息、生物地理分布和宿主预测。在群落范围内采用MIUViG标准,补充了未培养细菌和古细菌的单菌基因组最小信息(Minimum Information about a Single Amplified Genome,MISAG)和宏基因组(Minimum Information about a Metagenome-Assembled Genome,MIMAG)标准,将改进公共数据库中非培养病毒基因组的报告。反过来,这将有助于更有力的对全球病毒领域的系统探索。

介绍

目前的估计是,在大多数栖息地,病毒粒子的数量大大超过活细胞,但只有极小一部分病毒是在实验室培养的。通过不依赖培养的测序手段,发现了前所未有的病毒多样性。从生物和非生物环境中,重新构建非培养病毒的基因组方面已经取得了进展,而无需实验室分离病毒-宿主系统。例如,在过去2年,在宏基因组和宏转录组数据集中已经鉴定出超过75万个非培养的病毒基因组(uncultivated virus genomes,UViGs),是从人工培养的病毒中测序得到的基因组总数的5倍(图1),并且在公开可获得的病毒序列中,未培养的病毒基因组(UViGs)已经代表了≥95%的病毒分类多样性。宏基因组协议是基于双链DNA测序的,虽然这并不能很好的代表病毒基因组测序,但是基于宏基因组和宏转录组得到的未培养病毒基因组(UViGs)仍然能够评估全球病毒多样性,并评估病毒群落的结构和驱动因素。UViGs也有助于提高我们对病毒进化历史和病毒-宿主之间相互作用的理解。

图1 随着时间推移病毒基因组数据库的大小

Size of virus genome databases over time

显示了基于培养的病毒基因组(蓝色和绿色)或非培养病毒基因组(UViGs)(黄色)的序列。对于来自纯培养的病毒基因组,显示了基因组的数量(蓝色)和“参考”基因组的数量(绿色)。

对于依赖培养方法得到的病毒基因组数量是通过一下方法得到:2018年1月,通过“Viruses[Organism] AND srcdb_refseq[PROP] NOT wgs[PROP] NOT cellular organisms[ORGN]
NOT AC_000001:AC_999999[PACC]” 查询参考基因组和“Viruses[Organism] NOT cellular organisms[ORGN] NOT wgs[PROP] NOT AC_000001:AC_999999[pacc] NOT gbdiv syn[prop] AND nuccore genome samespecies[Filter]”查询病毒基因组总数;在NCBI核苷酸数据库门户网站上(https://www.ncbi.nlm.nih.gov/ nuccore)下载了数据;来自流感病毒数据库(https://www.ncbi.nlm.nih.gov/genomes/FLU/Database/nph-select.cgi?go=genomeset)的基因组也被添加到病毒基因组的总数中。

不依赖培养的病毒(UViGs)基因组从宏基因组测序组装,微生物基因组中提取,病毒基因组测序组装。非培养病毒基因组总数是通过整合公开发表的文章和三次查找IMG/VR数据库得到的(查找时间分别为:2017年1月、2018年1月和2018年7月)

无论是真核的、细菌的、古细菌的还是病毒的基因组,基于单个研究独立分析和解释都有巨大的挑战。为了应对这些挑战,起草了MISAG(单菌基因组标准)和MIMAG(宏基因组标准),以提高往往不完整的来自单细胞或宏基因组序列的微生物基因组的报告质量。虽然MISAG和MIMAG的某些方面可以应用于UViGs,但是病毒基因组组成和内容、复制策略和宿主的异常多样性意味着UViGs的完整性、质量、分类学和生态学需要通过病毒特异性指标来评估。

基因组标准联合会(The Genomic Standards Consortium,http://gensc.org)维护着MIxS的元数据清单(metadata checklists),包括基因组和宏基因组序列、标记基因序列以及单一扩增和宏基因组组装的细菌和古生菌基因组。在此,我们提出了一套标准,这些标准扩展了MIxS,包括UViGs的识别、质量评估、分析和报告,以及如何进行这些分析的建议。我们提供了一个元数据清单(metadata checklist),用于数据库提交和UViGs的发表。这个元数据清单(metadata checklists)设计得足够灵活,可以适应一段时间内的技术和方法变化。这些整合到一起的信息可以通过MIUViG清单直接提交给国际核苷酸序列数据库协作(International Nucleotide Sequence Database Collaboration,INSDC)成员的数据库——日本DNA数据库(the DNA Database of Japan,DDBJ)、欧洲分子生物学实验室-欧洲生物信息学研究所(the European Molecular Biology Laboratory–European Bioinformatics Institute,EMBL-EBI)和美国国家生物技术信息中心(US National Center for Biotechnology Information,NCBI)——这些数据库将与UViG序列一起保存和展示元数据清单。这些MIUViG标准还应与现有的病毒基因组分析指南一起使用,包括国际病毒分类委员会(the International Committee on Taxonomy of Viruses,ICTV)发布的指南,他们最近批准将UViGs纳入正式的病毒分类方案(https://talk.ictvonline.org)。**尽管MIUViG标准和最佳实践是为感染微生物的病毒基因组设计的,但它们也可以应用于感染动物、真菌和植物的病毒,并且与已经存在的用于这些病毒流行病学分析的标准兼容。**

病毒富集后UViGs的回收

Recovery of UViGs after virus enrichment

可以从富含病毒基因组(即病毒宏基因组和单病毒基因组)的数据集检索UViGs基因组(图2)。病毒宏基因组通常通过结合过滤步骤、DNA酶或RNA酶处理,以及根据目标病毒提取DNA或RNA,然后反转录(寻找RNA病毒)和鸟枪法测序来获得。可以应用靶向序列捕获方法来回收特定的病毒组(图2),并且这些方法在只有少量病毒存在时(例如,临床样品),被证明特别有用。单个病毒测序方法是在基因组扩增和测序之前使用流式细胞仪对单个病毒颗粒进行分类,并扩增单个病毒基因组(single amplified genomes,SAGs)(图2)。病毒宏基因组和单病毒基因组通常使用短读长、高通量测序平台进行测序,如Illumina测序,并通过与微生物基因组和宏基因组相似的算法进行组装。然而,由于基因组相对较小(NCBI病毒参考序列数据库中92%的病毒基因组小于100 kb),基于短读长的基因组装配可能很快被长读长的测序技术(例如,PacBio zero-mode waveguide 技术或牛津纳米孔测序技术)所取代图2)。这将更容易从混合样品中得到单个病毒基因组。

图2 UViGs的识别

Identification of UViGs

用来获得UViGs的方法示意图。样品制备(橙色)和生物信息学分析(蓝色)显示了从组装MAG和SAG改编而来的步骤,或为UViG添加的步骤。病毒定位和识别特别需要的步骤用粗体突出显示。

病毒富集后产生的数据集的主要优势是组成丰富和稀有的病毒都能从头组装得不错,增强了对序列来源是病毒的信心,以及对活性(active)和“非活性(inactive)”或“隐性(cryptic)”病毒(即样品中存在但不能感染的病毒)进行测序的能力。然而,由于所使用的选择性过滤步骤,富含病毒的数据集可能过度表达(over-representation)具有高爆发大小的强毒病毒(从每个受感染细胞释放出大量病毒颗粒),而对衣壳≥0.2 um的较大病毒(如巨型病毒)表达不(under-representation)足。此外,计算(in silico)方法通常是确定从富含病毒的样品中获得的UViGs宿主范围的唯一选择。

未经富集后的UViGs的回收

Recovery of UViGs without enrichment

病毒序列也存在于未经病毒富集的数据集中,包括分选细胞、组织或用0.2 um滤膜过滤的环境样品。这些序列可能来源于在细胞中复制的病毒,来源于整合入宿主基因组或作为附加体元素存在于宿主细胞中的温和病毒(原病毒或原噬菌体),或来源于样品中存在的游离病毒颗粒。

分析未经病毒富集的测序数据有几个优点。它可以检测溶解性感染、潜伏性感染和持续性感染,它克服了基于病毒颗粒大小的选择所产生的一些偏差,并且它可以应用于任何宏基因组数据。然而,来自未经病毒富集数据集的UViGs可能偏向于那些会感染样品中占主要的宿主细胞的病毒,而稀有病毒或感染稀有宿主的病毒可能代表不足(under-represented)或不存在。最后,病毒富集和非病毒富集数据集之间的比较表明,分析不同大小和不同样品类型的UViGs对于探索病毒基因组序列空白是有价值的。

病毒序列的计算鉴定方法

Computational identification of viral sequences

无论数据集的类型如何,UViGs的病毒来源都必须得到验证,因为即使是富含病毒颗粒的样本也仍然含有大量的细胞DNA。污染可能来自于难以区分的细胞组分(例如,超小细菌),也可能来自于在病毒组分中捕获到细胞外DNA。比如来源于包裹在病毒衣壳或类似颗粒(例如,通过转导)、含DNA的膜泡,或基因转移剂(gene transfer agents)等。

已经开发了几种生物信息学工具和方法来鉴定噬菌体和古细菌病毒的序列;真核病毒;或者噬菌体、古细菌病毒和大型真核病毒的组合。这些方法依赖于几个特征,如果序列与已知病毒(在基因含量或核苷酸使用模式方面)显著相似,或者序列与任何已知病毒和细胞基因组无关,但含有一个或多个病毒标志性基因,则该序列被认为是病毒。因此,UViGs必须附有病毒检测工具和使用的协议列表,以及所用应用的阈值(表1)。

表1 UViGs的强制元数据清单

List of mandatory metadata for UViGs

鉴定整合病毒及其在宿主基因组中的精确边界是有困难的

值得注意的是,没有一种高通量的方法可以准确地将活的病毒(仍然能够复制和产生病毒体)与失活病毒的分开来。因此,尽管预测方法正在改进,但被确定为原病毒的UViGs应明确标记为原病毒,以便这些提醒是清楚的。

UViGs的组装质量评估

Estimating quality of UViGs

我们把UViG序列分为三类:基因组片段、高质量草图基因组和已经完成的(finished)基因组(图3表2)。这些类别反映了MISAG和MIMAG中的类别,并且它们与流行病学和监测中已经提出的小病毒全基因组测序的类别相匹配。UViG质量比从宏基因组中组装的基因组(metagenome-assembled genomes,MAGs)或SAGs更难评估,因为大多数病毒缺乏可用于评估基因组草图完整性的保守的单拷贝标记基因集。然而,也有例外,例如大型真核双链DNA病毒。迄今为止,研究人员已经通过识别环状重叠群或具有反向末端重复(inverted terminal repeats as)的重叠群作为假定的完整基因组来估计UViG序列的完整性。对于线性重叠群,完整性是通过与参考基因组序列进行比较来估计的,并且通常需要对(候选)(亚)科或属进行分类分配,因为基因组长度在这些等级相对一致。这种分配可以基于特定标记基因的检测,例如分支特异的病毒同源群(clade-specific viral orthologous groups),或者基于基因组的分类工具(参见UViGs的分类)。对片段基因组来说,估计完整性更加困难,这需要密切相关的参考基因组或额外的体外实验。

代表预期基因组长度的<90%或无法确定预期基因组长度的重叠群或基因组箱(bins)将被视为基因组片段。这一类别可能包括大到足以根据基因含量和平均核苷酸同一性被归入已知病毒组的UViG片段。然而,建立新的分类群需要高质量的草图或完成的基因组(图3)。来自UViG片段的序列可用于系统发育和多样性研究,或者作为病毒操作分类单位的参考(operational taxonomic units),或者通过分析这些基因组片段中编码的病毒标记基因;例如衣壳蛋白、终止酶、核糖核苷酸还原酶和依赖于DNA或RNA的RNA聚合酶。类似地,UViG片段可以被分析以评估未知病毒的功能基因互补情况或将其与潜在宿主联系起来。重要的是,目前用于自动病毒序列鉴定的方法不能可靠地鉴定短的(<10kb)病毒序列,对此应极其谨慎地进行解释。

图3 UViG的分类和相关序列分析

UViG classification and associated sequence analyses

“潜在功能”是基因内容分析(gene content analysis)中使用的功能注释。“寄主预测”是不同计算(in silico)寄主预测工具的应用。“分类”是使用标记基因或基因含量比较将重叠群分类到已建立的组。“多样性和分布”包括通过宏基因组reads 映射(mapping),vOTU聚类和相对丰度估计,在地理尺度上或在宿主相关数据集的解剖位点上进行。“新分类群”涉及完全基于UViG序列的新提议群(例如科或属)的划分。“新参考种”是指在ICTV的建立新条目的建议。

被预测为完整的或代表预期基因组序列≥ 90%的重叠群或基因组箱(bins)是高质量的草图,这也符合微生物基因组的标准。重复区域可能导致部分基因组错误组装为环形重叠群。因此,在评估UViG完整性时,应考虑组装好的环形重叠群的长度。对于不是来自一致组装集的UViGs,例如单一的长读长(single long reads),base calling quality > 99% (phred分数 > 20)来分配“高质量草图”的标签。基因组序列组装成一个单一的重叠群,或者每个片段一个重叠群,经过广泛的人工审查和注释,可以标记为“完整的基因组”。注释必须包括识别推定基因的功能;结构、复制或溶源模块;以及转录单位。“完成的基因组”类别只保留给最高质量的人工选择的UViGs,这是建立新病毒物种所必需的(图3表2)。

表2 每个类别所需特性概述

Summary of required characteristics for each category

与SAGs和MAGs不同,UViGs的质量评估不包括基因组污染的阈值。在基因组分箱(bin)的情况下,污染问题最为突出,而大多数UViGs由单个重叠群表示,计算机模拟(in silico simulations)显示嵌合序列很少,并且存在率< 2%。此外,没有工具可以自动评估UViG污染,因此污染信息不包括在当前的MIUViG清单中。然而,MIUViG清单未来的更新版本可能中可能会包含。如果要开发这种工具,就会包含污染阈值。例如,这种工具可能利用单拷贝标记基因(一旦这些基因在更广泛的病毒类群中定义),或者它可能利用宏基因组读数的覆盖,宏基因组读数原则上应该沿着基因组均匀分布,除了高度保守的基因之外,没有重大偏差。

UViGs的注释

Annotation of UViGs

UViGs的功能注释包括以下任务:预测基因组序列中的特征,如蛋白质编码基因、tRNAs和整合位点;将功能分配给尽可能多的预测特征;并将剩余的假设蛋白质分配给未表征的蛋白质家族。已经为不同类型的病毒建立了注释流程,但是病毒基因组类型之间的巨大差异可能会阻碍能够注释每种病毒的统一工具的开发。因此,我们建议报告用于注释UViGs基因组的软件。

应明确说明用于注释预测蛋白质的方法和参考数据库。新病毒基因的同源物可能不能用成对序列相似性检测的标准方法检测,如BLAST,而是需要使用更敏感的图谱相似性方法,如HMMER、PSI-BLAST或HHPred。尽管已经收集了许多蛋白质家族的序列图谱,但它们经常与任何特定功能无关。因此,UViG分析应始终报告(i)特征预测方法,(ii)序列相似性搜索方法,以及(iii)搜索的数据库(框1和补充表1)。

应明确说明用于注释预测蛋白质的方法和参考数据库的选择。新病毒基因的同源物可能无法用标准的成对序列相似性检测(pairwise sequence similarity detection)方法(如BLAST)检测,而是需要使用更敏感的图谱相似性(profile similarity)方法(如HMMER、PSI-BLAST或HHPred)。尽管已经收集了许多蛋白质家族的序列图谱,但它们经常与任何特定功能无关。因此,UViG分析应始终报告(I)特征预测方法,(ii)序列相似性搜索方法,以及(iii)搜索的数据库。

UVigs的分类

Taxonomy of UViGs

分类信息可以提供UViG与已知病毒之间关系。虽然用于病毒分类的信息和标准随着时间的推移发生了变化,但病毒分类现已收敛(converge)到基于基因组的分析。由于病毒基因组、突变率和进化范围非常广泛,ICTV为每个病毒组制定了具体的分界标准。最近,在使用全基因组平均核苷酸同一性进行物种等级分类方面出现了共识,这用于下游生态、进化和功能研究。这一共识是通过分析已发表的群体遗传学研究和NCBI参考文献病毒基因组的基因含量比较而达成的。我们建议正式使用物种级病毒群,并命名这些“病毒操作分类单元”(vOTUs),以避免混淆,因为在文献中物种群被不同地命名为“病毒群(viral population)”、“病毒群(viral cluster)”或“重叠群(contig cluster)”。基于NCBI参考序列和IMG/VR数据库中现有序列的比较,我们建议95%平均核苷酸同一性,超过85%比对分数(95% average nucleotide identity over 85% alignment fraction)(相对于较短序列)的标准阈值。尽管部分基因组仍然难以分类,但这些共同的阈值将使比较分析成为可能。此外,vOTU报告应包括聚类方法和阈值、使用的参考数据库和基因组比对方法,因为在不同方法之间观察到微小的差异。

对于比物种更高的分类等级,虽然已经提出了几种方法,但还没有就应该使用哪种方法达成共识。记住这一点,包括分类学在内的UViG报告必须清楚地指出所应用的方法和阈值,任何新的分类法都必须强调为初步的(例如,“属级聚类(genus-rank cluster)”、“假定属(putative genus)”或“候选属(candidate genus)”,而不仅仅是“属(genus)”,因为这一类别是为ICTV认可的群体保留的。作者应向ICTV提交正式的分类建议供其考虑。

最后,关于基因组的性质和表达方式的信息(比如Baltimore classification)应该包括在UViG的描述中。同样,应报告基因组的预测分割状态(片段或者非片段),通常来源于分类和与最近参考文献的比较。

计算机模拟预测寄主

In silico host prediction

一旦一个新的病毒基因组被组装,理解这个病毒的生态作用的一个重要步骤就是预测其宿主。计算机模拟(In silico)方法通常是UViGs预测记住的唯一选择。这些可以分为四种主要类型。首先,当存在密切相关的病毒时,可以基于UViG和参考病毒基因组之间的序列相似性,以相对高的精度预测宿主。其次,可以基于UViG和宿主基因组之间的序列相似性预测宿主。这些序列相似性的范围可以从短的精确匹配(~ 20–100 bp),包括CRISPR间隔区,到长( > 100 BP)核苷酸序列匹配,包括整合到较大宿主重叠群中的整合病毒。基于序列相似性的宿主范围预测是最可靠的,但需要对密切相关的宿主基因组进行测序。第三,从结构域到属级的宿主分类可以从反映病毒和宿主基因组在G+C含量、k-mer频率和密码子使用方面共同进化的核苷酸使用特征来预测。这些方法通常不如基于序列相似性的方法具体,不能可靠地预测属级以下的宿主范围,但可以为更多的UViGs提供预测的宿主。最后,宿主预测可以通过比较宿主和病毒序列在空间或时间尺度上的丰度分布,或者通过丰度相关性,或者通过更复杂的基于模型的相互作用预测来计算。尽管很少有数据集可用于基于丰度分布比较的宿主预测的稳健评估,但随着高分辨率时间序列宏基因组学变得更加普遍,我们预计这种方法将变得更加强大和普遍。

由于所有这些生物信息学方法都是预测性质的,因此报告有效的错误发现率估评估至关重要。此外,计算工具不能定量预测侵染的特征(例如,感染率或爆发大小),而侵染的定量特征对于理解病毒对宿主生物学的影响非常重要,目前仅适用于感染细菌或古细菌的病毒。然而,这些预测对于随后的计算(in silico)、体外和体内研究是重要的指导,包括明确证明特定微生物宿主病毒感染的实验验证。应报告宿主预测以及所用特定工具的详细信息,更重要的是,根据公布的基准或研究中进行的测试得出的估计精度。这些信息将允许病毒宿主数据库逐步整合UViGs,同时仍然控制向用户提供的预测的敏感性和准确性。

报告UViGs

Reporting UViGs

我们建议共享和归档UViGs和UViG相关数据的最佳做法如下:数据发布应通过DDBJ (https://www.ddbj.nig.ac.jp/index-e.html)、EMBL-EBI欧洲核苷酸档案馆(ENA; https://www.ebi.ac.uk/ena)或NCBI(GenBank and the Sequence Read Archive; https://www.ncbi.nlm.nih.gov/nucleotide)的成员数据库之一,以INSDC的数据资源(http://www.insdc.org/)为中心。如果需要,可以直接联系INSDC数据库管理员来提交大规模批量数据集。当作为UViG研究的一部分生成新数据集时,应根据与环境相关的混合清单描述测序样本,并提交原始读取数据。高质量和完成的UViGs应作为整体提交,前者作为“草图”报告,并附有所需原始数据(**表1**)。可以提交不完整的组装数据,但它们必须附带必需的原始数据。

在可行的情况下,注释和分类应提交给INSDC,在ENA的出现和丰度数据应作为“分析”记录报告。通过短读宏基因组作图估计的丰度数据报告应包括关于所用核苷酸同一性和覆盖阈值的信息,同时对假阳性率和假阴性率的相应估计要么重新计算,要么从文献中提取。出版物中必须引用所有INSDC加入代码。对于ICTV分类,目前只考虑编码完整的基因组(完整的高质量和完成的UViGs草图)。

结论

相对于MISAG和MIMAG标准而言,病毒最小信息标准(MIUViG)和基于为非培养病毒的最佳分析流程都是具体的病毒特异性的。随着测序技术的出现和成熟,病毒基因组学和宏基因组学正在迅速发展和改进。与此同时,基于基因组的病毒分类方法以及病毒基因组和/或蛋白质的统一的、全面的和注释的参考数据库的发展仍在快速进行。社区采用这些标准,包括通过与其他病毒协会(ICTV)和数据中心(DDBJ、EMBL-EBI和NCBI)的持续合作,将为系统探索病毒基因组序列空间提供框架,并使研究社区能够更好地利用和公开报告UViGs。

翻译:秋芒树

责编:文涛 南京农业大学

审核:刘永鑫 中科院遗传发育所

Reference

Simon Roux, Evelien M. Adriaenssens, Bas E. Dutilh, Eugene V. Koonin, Andrew M. Kropinski, Mart Krupovic, Jens H. Kuhn, Rob Lavigne, J. Rodney Brister, Arvind Varsani, Clara Amid, Ramy K. Aziz, Seth R. Bordenstein, Peer Bork, Mya Breitbart, Guy R. Cochrane, Rebecca A. Daly, Christelle Desnues, Melissa B. Duhaime, Joanne B. Emerson, François Enault, Jed A. Fuhrman, Pascal Hingamp, Philip Hugenholtz, Bonnie L. Hurwitz, Natalia N. Ivanova, Jessica M. Labonté, Kyung-Bum Lee, Rex R. Malmstrom, Manuel Martinez-Garcia, Ilene Karsch Mizrachi, Hiroyuki Ogata, David Páez-Espino, Marie-Agnès Petit, Catherine Putonti, Thomas Rattei, Alejandro Reyes, Francisco Rodriguez-Valera, Karyna Rosario, Lynn Schriml, Frederik Schulz, Grieg F. Steward, Matthew B. Sullivan, Shinichi Sunagawa, Curtis A. Suttle, Ben Temperton, Susannah G. Tringe, Rebecca Vega Thurber, Nicole S. Webster, Katrine L. Whiteson, Steven W. Wilhelm, K. Eric Wommack, Tanja Woyke, Kelly C. Wrighton, Pelin Yilmaz, Takashi Yoshida, Mark J. Young, Natalya Yutin, Lisa Zeigler Allen, Nikos C. Kyrpides & Emiley A. Eloe-Fadrosh. Minimum Information about an Uncultivated Virus Genome (MIUViG). Nature Biotechnology 37, 29-37, doi:10.1038/nbt.4306 (2019).

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存